Importando bibliotecas que serão utilizadas

library(dplyr)
library(purrr)
library(plotly)
library(janitor)
library(ggplot2)
library(corrplot)
source("multiplot.R")

Carregando base e melhorando nome das colunas

base::load("../inputs/us_change.rda")
data <- us_change %>% janitor::clean_names()
  1. Calculando número índice de todas as variáveis, para isto foram criadas duas funções para auxiliar nos cálculos
calc_indice <- function(x) {
  y <- x
  y[1] <- 100
  for(i in 2:length(x)) {
    y[i] <- (x[i]/x[i-1]) * y[i-1]
  }
  return(y)
}

calc_indice_variacao <- function(x) {
  y <- x
  y[1] <- 100
  for(i in 2:length(x)) {
    y[i] <- (1 + x[i]/100) * y[i-1]
  }
  return(y)
}
data_indice <- data %>% 
  dplyr::filter((quarter >= as.Date("2000-01-01"))) %>% 
  dplyr::select(-quarter) %>% 
  purrr::map_df(function(x) x %>% calc_indice_variacao())

quarters <- data %>%
  dplyr::filter((quarter >= as.Date("2000-01-01"))) %>% 
  dplyr::select(quarter)


data_indice <- data_indice %>% 
  dplyr::mutate(quarter = quarters$quarter)

Plotando variáveis para efeito de verificação

  1. Criando a correlação entre as variávies utilizando dos dados em número índice
correl <- stats::cor(data_indice %>% 
                      dplyr::select(-quarter))  
##              consumption      income production     savings unemployment
## consumption   1.00000000  0.99511754  0.7558454  0.07822587  -0.11691529
## income        0.99511754  1.00000000  0.7277307  0.17080259  -0.08431893
## production    0.75584542  0.72773073  1.0000000 -0.12579960  -0.54518215
## savings       0.07822587  0.17080259 -0.1257996  1.00000000   0.17372121
## unemployment -0.11691529 -0.08431893 -0.5451822  0.17372121   1.00000000

Criando a correlação entre as variáveis utilizando das variáveis em taxa de variação

correl <- stats::cor(data %>% 
                      dplyr::filter((quarter >= as.Date("2000-01-01"))) %>% 
                      dplyr::select(-quarter))
##              consumption      income  production     savings unemployment
## consumption    1.0000000  0.22891397  0.48396431 -0.24460544  -0.47826764
## income         0.2289140  1.00000000  0.14337067  0.84544089  -0.09033545
## production     0.4839643  0.14337067  1.00000000 -0.06058825  -0.72529302
## savings       -0.2446054  0.84544089 -0.06058825  1.00000000   0.11381076
## unemployment  -0.4782676 -0.09033545 -0.72529302  0.11381076   1.00000000

Como pode-se perceber a correlação em ambos os casos foi a mesma, isto ocorre pois as duas bases estão com suas variáveis em nível, desse modo não existe diferença em calcular a correlação com as variáveis em número índice e em taxa de variação.

  1. Criando visualizações para ajudar no entendimento sobre a dinâmica das variáveis

  1. A partir dos gráficos construídos é possível identificar que as variáveis apresentam uma evolução no tempo com bastantes picos, tanto positivos quanto negativos, isto ocorre devido aos diversos eventos externos que influenciam diretamente na economia do país. Além disso, as variáveis que apresentam uma maior correlação, como por exemplo poupanças e renda, sofrem os efeitos de tais eventos de forma bastante correleta, baseando sempre na matriz de correlação, construída em itens anteriores.

  2. É possível encontrar nas séries alguns movimentos abruptos, como nos anos por volta de 1980 em que os EUA sofreram por um grande período de instabalidade econômica, muito pelo fato de não saber se comportar em frente a novos concorrentes do mercado internacional, além de questões complicadas envolvendo o Oriente Médio. Também é possível identificar movimentos abruptos por volta de 2008-2009, em que os EUA passavam pela sua maior recessão financeira desde 1930.